總是陳述兩個假設:
"零假設",$H_0$
"替代假設",$H_a$
假定零假設為真,直到測試證明並非如此。
只有在有足夠的證據拒絕原假設時才接受備擇假設。
原假設和備擇假設的選擇應基於「期望條件」。例如,如果分析師試圖表明股票的平均年回報率已超過 8%:
原假設是總體參數「等於」某個值。另一種假設是它“不等於”該值。
$$H_0: θ = θ_0 \ 與 \ H_a: θ ≠ θ_0$$
$$H_0: θ ≤ θ_0 \ 與 \ H_a: θ > θ_0$$
$$H_0: θ ≥ θ_0 \ 與 \ H_a: θ < θ_0$$
「檢定統計量」是基於樣本計算的數量,其值是決定是否拒絕原假設的基礎。
假設檢定統計量的分佈為以下之一:
t-分佈
(用於 t 檢定)卡方 (χ2)
分佈F-分佈
(用於 F 檢定)$$測試\統計=\frac{\H_0\下\總體\參數\的樣本\統計−值}{\樣本\統計的標準\誤差}$$
例如。檢定統計量將以以下方式計算:
$\frac{\bar{X_{RP}}−\mu_{0}}{s\bar{X}}=\frac{\bar{X_{RP}}−0}{s/\sqrt{n} } = \frac{\bar{X_{RP}}}{s\bar{X}}$
對於樣本平均值 $\bar{X}$,根據標準差為 $\sigma$ 的總體產生的樣本計算得出,標準誤差由以下兩個表達式之一給出:
$\sigma\bar{X}=\frac{\sigma}{\sqrt{n}}$
當我們知道$σ$(總體標準差)時。
$s\bar{X}=\frac{s}{\sqrt{n}}$
當我們不知道總體標準差$\mu$並且需要使用樣本標準差$s$來估計時。
計算檢定統計量後,可以拒絕或不拒絕原假設。該決定基於假設特定顯著性水準的比較,該比較確定需要多少證據來拒絕零假設。
「顯著水準」反映了我們需要多少樣本證據來拒絕零。它是錯誤拒絕零值 ($\alpha$) 的機率。
**「檢定效能」**是正確拒絕零值的機率,即當零值錯誤時拒絕零值的機率。
$$功率 = 1- β$$。
檢定假設時出現 I 類錯誤的機率,以 $α$ 表示。進行假設檢定的常規顯著水準是:
II 類錯誤的機率為 $β$。透過減少 α 來降低發生 I 類錯誤的機率將增加發生 II 類錯誤的機率。
當我們檢驗原假設時,如果我們發現檢定統計量的計算值比給定值或由指定顯著水準 $α$ 決定的值更極端,我們就拒絕原假設。我們說結果具有統計顯著性。否則,我們不會拒絕虛無假設,我們會說結果在統計上不顯著。
檢定統計量的「拒絕點」(「臨界值」)是與計算的檢定統計量進行比較以決定是否拒絕原假設的值。在圖表中,請注意拒絕區域中的面積對應於顯著性水準。
$α$ 顯著水準的雙邊檢定與 $(1−α)$ 信賴區間相同。如果檢定統計量落在信賴區間之外,則拒絕虛無假設。
「p 值」是可以拒絕原假設的最小顯著水準。分析師和研究人員經常報告與假設檢定相關的 p 值也稱為邊際顯著性水準。
我們可以在上面提出的假設檢定框架中使用 p 值作為使用拒絕點的替代方法。
p 值越小,拒絕原假設的證據就越有力。
統計意義不一定意味著經濟意義。例如,投資組合回報的微小差異可能具有統計意義,但交易成本和其他費用可能會阻礙成功實施。
範例
風險溢價假設
$H_0: \mu_{RP} \leq 0\ \股票的總體\平均\風險\溢價(\mu_{RP})\小於\或等於\零$
$H_a: \mu_{RP} > 0\ 股票的整體平均風險溢酬為正。
假設我們可以根據中心極限定理進行 z 檢驗,因為我們的樣本有很多觀測值。我們可以進行 z 檢定,因為我們可以合理地假設檢定統計量遵循標準常態分佈。
由於是單尾的,因此拒絕點將以 $z_{0.05}$ 表示,假設檢定統計量遵循標準常態 z 分佈,則可以發現 $z_{0.5}$ 為1.645。如果 $z > 1.645$,我們拒絕原假設。 5% 的結果位於右側的標準常態分佈的值為 $z_{0.05} = 1.645$。讓 $z$ 代表檢定統計量的計算值。
股票相對於票據報酬率的算術平均股權風險溢酬 $\bar{X}_{RP}$ 為 7.5%,樣本標準差為 19.5%。為了計算檢定統計量:
風險溢酬為正。每年 7.5% 的估計風險溢酬幅度在經濟上也非常有意義。基於這些考慮,投資人可能決定將資金投入股票。
# 指定顯著性水平
alpha = 0.05
# 拒絕點
rej_point = 1.645
#
mean = 0.075
std = 0.195
n = 118
# 計算樣本平均數的標準誤
sesm = std / n**0.5
# 計算檢定統計量
t_stat = (mean - 0) / sesm
print(sesm, t_stat)
#
if t_stat > rej_point:
print('我們拒絕虛無假設,轉而支持另一種假設,即股票的風險溢價為正。')
else:
print('未能拒絕原假設')
# 使用 Scipy 取得 p_value
# z-score
p_value = scipy.stats.norm.sf(abs(t_stat))
「t 檢定」是使用遵循 t 分佈的統計量(t 統計量)的假設檢定。 t 分佈:
對於關於具有未知方差 $\sigma^2$ 的正態分佈總體的總體均值的假設檢驗,並且如果抽樣總體具有未知方差並且以下任一條件成立:
$$t_{n−1}=\frac{\bar{X}−μ_0}{s/\sqrt{n}}$$
$t_{n−1}$ = 自由度為 $n − 1$ 的 t 統計量($n$ 為樣本大小)
$\bar{X}$ = 樣本平均值
$μ_0$ = 總體平均值的假設值
$s$ = 樣本標準差
t 統計量的分母是樣本平均標準誤的估計值,$s\bar{X}=\frac{s}{\sqrt{n}}$
實際上,這兩個檢定是相似的,因為隨著 $n$ 變大,t 分佈接近 z 分佈。
$$z=\frac{\bar{X}−μ_0}{\sigma/\sqrt{n}}$$
$$z=\frac{\bar{X}−μ_0}{s/\sqrt{n}}$$
$\sigma$ = 已知總體標準差
$s$ = 樣本標準差
$μ_0$ = 總體平均值的假設值
以下拒絕點通常用於 z 檢定。
當我們可以假設兩個總體呈常態分佈且未知總體變異數相等時,基於「獨立隨機樣本」的「t 檢定」由下式給出
$$t=\frac{(\bar{X_1}−\bar{X_2})−(μ_1−μ_2)}{\displaystyle\sqrt{(\frac{s^2_p}{n_1}+\frac{s^ 2_p}{n_2})}}$$
當我們可以假設兩個總體呈常態分佈但不知道總體變異數並且不能假設它們相等時,基於獨立隨機樣本的「近似 t 檢定」由下式給出
$$t=\frac{(\bar{X_1}−\bar{X_2})−(μ_1−μ_2)}{\displaystyle\sqrt{(\frac{s^2_1}{n_1}+\frac{s^ 2_2}{n_2})}}$$
其中我們使用 t 分佈表,該表使用透過公式計算的「修改」的自由度
$$ df=\frac{(\frac{s^2_1}{n_1}+\frac{s^2_2}{n_2})^2}{\frac{(\frac{s^2_1}{n_1})^ 2}{n_1}+\frac{(\frac{s^2_2}{n_2})^2}{n2}}$$
只有當樣本彼此不相關(即獨立)時,先前的測試才有效。如果獨立性假設無效,則必須使用另一種方法。
「配對觀察」是指相互依賴的觀察。 (例如,由於共同的市場因素,兩隻基金在同一時期的每月收益可能存在相關性。配對比較檢定是相關項目差異的統計檢定。)
**透過計算基於差異的標準誤差,以下介紹的 t 檢定考慮了觀測值之間的相關性。
計算取自相關樣本的兩個隨機變數之間的差異(表示為 di)。然後,對差異列表進行統計分析。
假設 $μ_d$ 和 $μ_{d0}$ 分別代表觀察到的和假設的總體平均差。假設通常按以下方式製定:
對於總體變異數未知的常態分佈總體,檢定統計量為:
其中 $n$ = 觀測值對的數量。
步驟2 樣本方差,以$s^2_d$表示,為
$$s^2_d=\frac{\sum_{i=1}^n{(d_i−\bar{d})^2}}{n−1}$$
步驟 3 使用樣本標準差 $sd$ 計算“平均差的標準誤差”
$$s_{\bar{d}}=\frac{s_d}{\sqrt{n}}$$
其中 $df =n − 1$,
$n$ = 配對觀測值的數量,
$\bar{d}$ = 樣本平均差(如公式 10 所示),
$s_{\bar{d}}$ = $\bar{d}$ 的標準誤差(如公式 12 所示)。
使用案例:
不涉及參數的測試,或對樣本所來自的總體做出最小假設的測試。